期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于支持向量机分类和语义信息的中文跨文本指代消解
赵知纬 顾静航 胡亚楠 钱龙华 周国栋
计算机应用    2013, 33 (04): 984-987.   DOI: 10.3724/SP.J.1087.2013.00984
摘要998)      PDF (642KB)(577)    收藏
跨文本(实体)指代消解(CDCR)的任务就是把所有分布在不同文本但指向相同实体的词组合在一起形成一个指代链。传统的跨文本指代消解主要采用聚类方法来解决信息检索中遇到的重名消歧问题。将聚类问题转换为分类问题,并采用支持向量机(SVM)分类器来解决信息抽取中的重名消歧和多名聚合问题。该方法可有效融合实体名称的构词特征、读音特征以及文本内部和文本外部的多种语义特征。在中文跨文本指代语料库上的实验表明,同聚类方法相比,该方法在提高精度的同时,也提高了召回率。
参考文献 | 相关文章 | 多维度评价
2. 词汇语义信息对中文实体关系抽取影响的比较
刘丹丹 彭成 钱龙华 周国栋
计算机应用    2012, 32 (08): 2238-2244.   DOI: 10.3724/SP.J.1087.2012.02238
摘要917)      PDF (1150KB)(395)    收藏
提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程度上提高中文关系抽取的性能;同时,《同义词词林》能补充实体类型信息的不足,因而无论是否加入实体类型信息,其语义信息都能大幅度地提高大部分关系类型的抽取性能;而《知网》则和实体类型信息存在冲突,因此在已知实体类型信息的前提下,仅能提高个别关系类型的抽取性能。
参考文献 | 相关文章 | 多维度评价